甲基化信号值矩阵差异分析主要图表
差异分析永远是最平易近人的策略,我们前面整理的各种系列教程,miRNA的,lncRNA的,mRNA芯片或者测序,circRNA系列的,都会得到表达矩阵,然后走差异分析。只不过是不同统计学分布的表达矩阵,后续使用不同R包而已,得到的差异分析结果的解释又取决于生物学背景,是否了解circRNA等分子。
同理,我们前面教程:450K芯片上面的甲基化探针到底需要进行哪些过滤 已经强调过了甲基化芯片数据分析的一些注意事项,以及标准代码,共享了大量的学习资料。现在一起来看看甲基化信号值矩阵差异分析主要图表吧,这样你拿到了我的标准代码,处理好你的数据后,也可以简单快速理解它。
主要图
以 Genome-wide DNA methylation profiling reveals novel epigenetic signatures in squamous cell lung cancer 文章为例子:
统计学显著的差异甲基化探针数量
首先450K芯片,过滤后剩下371K甲基化探针位点,然后1%是具有统计学显著的差异甲基化探针,如下:
文章描述:
After normalization, 371,000 probes from the methylation array were retained for analysis. Using the criteria of FDR p-value <0.05 and β difference ≥ 0.2, we identified 5214 probes (1771 gene) differentially methylated. Among them, 4001 probes (77%) were significantly hypermethylated, and 1213 probes (23%) were significantly hypomethylated in tu- mors (Fig. 1a).
一般来说,如果你走的champ流程,40万探针其实会拿到十多万差异的,但是有一个 β difference ≥ 0.2就可以筛到一千个左右的位点啦!
代码已经非常简单了,就是去GEO数据库你的数据集把矩阵下载下来,读入R,加上临床信息然后走下面的代码
# 下面的beta.m是甲基化矩阵,pD 是表型信息
myLoad=champ.filter(beta = beta.m ,pd = pD)
myNorm <- champ.norm(beta=myLoad$beta,arraytype="450K",cores=5)
group_list=myLoad$pd$group
myDMP <- champ.DMP(beta = myNorm,pheno=group_list)
差异甲基化探针信号值矩阵热图
前面的差异分析,比如那篇文章,拿到了5214 probes ,取信号值矩阵绘制热图如下:
b Two-dimensional hierarchical clustering was performed using the 5214 variable DNA methylation probes across all samples (n = 48).
当然了,这个热图绘制的丑爆了哦。
差异甲基化探针注释
位于基因组不同功能区域的甲基化探针信号值代表的生物学意义不一样,包括5’ UTR, first exon, gene body, 3’ UTR, CpG island, CpG shore, CpG shelf,这些注释,都是在厂商提供注释文件信息里面。所以差异分析拿到的高甲基化或者低甲基化位点就可以分类。
这些分类,其实champ包给你做完差异分析的时候,也是自动加水了,比如作者就是仅仅拿Excel表格画了个饼图。
GO或者KEGG等数据库功能注释
这个需要注意的是你不一定是对全部的差异甲基化位点所在的基因一窝蜂的拿去注释,首先,七千多个探针对应的基因仍然是好几千,这样的数量注释的意义不大。可以按照上面的分类,比如5’ UTR, first exon, gene body, 3’ UTR, CpG island, CpG shore, CpG shelf,这些地方的基因分开注释,拿到并行富集结果。
当然了,仍然是普通的超几何分布检验,至于这个图如何理解,就要结合统计学知识和生物学背景了。
主要表格
表格其实就是上面图的原始数据而已。
不知道你有没有推荐的好的甲基化文献,把简单的差异分析玩出花的呢?欢迎进入我们的甲基化交流群,或者留言推荐哈。
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
全国巡讲全球听(买一得五) ,你的生物信息学入门课
生信技能树的2019年终总结 ,你的生物信息学成长宝藏